Kompariranje artimetičkih sredina: T-test i ANOVA
Predavanje V
Prije nego počnemo sa radom, potrebno je da učitamo prethnodno instalirane R pakete koji će nam biti potrebni za rad :
setwd("put/do/radnog/foldera/")
library(readxl) # paket za čitanje baze u .xlsx formatu
library(psych) # paket za opisivanje podataka (deskriptivna statistika)
library(car) # paket za rekodiranje
library(gplots) # Paket za grafičku vizuelizaciju ANOVA testa
dem <- read_xlsx("demkat.xlsx")Učitavanje baze podataka demkat. Baza podataka sadrži informacije o državama:
drzava:naziv države (nominalna varijabla)tip_rezima:tip političkog režima (kategorička varijabla)dem_rezim:da li je država demokratija ili ne (dihotomna kategorička varijabla)etn_frak:nivo etničke frakcionalizacije (kategorička varijabla)oecd:da li je država članica OECD (organizacija za ekonomsku saradnju i razvoj) (nominalna varijabla)rodna_jed:nivo rodne jednakosti (kategorička varijabla)popul:veličina populacije (intervalna varijabla)pismen:nivo pismenosti stanovništva (intervalna varijabla)gini:indeks ekonomske nejednakosti (intervalna varijabla)gdp:godišnji bruto domaći proizvod (intervalna varijabla)nivo_dem:nivo demokratije (intervalna varijabla)
Istraživačka pitanja:
Da li je tip režima povezan sa nivoom ekonomskog razvoja?
Da li je rodna ravnopravnost povezana sa ekonomskim razvojem?
Da li su manje države demokratičnije od država sa većom populacijom?
Da li je etnička raznolikost povezana sa ekonomskom nejednakošću?
Hipoteze?
1. T-test
U situaciji u kojoj istraživač želi ispitati vezu između dvije varijable, od kojih je nezavisna varijable kategorička a zavisna intervalna, potrebno je primijeniti set odgovarajućih statističkih metoda.
Najosnovnija i često potcijenjena tehnika korišćena u ovim situacijama je T-test, koji nam daje odgovor na pitanje jesu li vrijednosti varijable statistički različite za dvije grupe obzervacija. Ovo je vrlo jednostavan test, koji se najviše koristi u eksperimentalnom okruženju, đe se ispitanici nasumično raspoređuju po tretmanu i kontrolnoj grupi. Ipak, T-testove možemo koristiti i u bilo kojem kontekstu đe imamo kategoričku varijablu sa dvije grupe (kategorije) i intervalnu varijablu koja nas zanima u pogledu moguće razlike između grupa.
Postoje razne verzije T-testa, zavisno o toga kako je studija dizajnirana: dizajn između grupa i dizajn unutar grupe. U prvom slučaju koristili bi T-test nezavisnih uzoraka, a u drugome t-test uparenih uzoraka.
Recimo da želimo znati razlikuju li se demokratije i nedemokratije po pitanju stepena ekonomskog razvoja. Ovđe nam može može poslužiti T-test nezavisnih uzoraka, jer bi u tom slučaju bili zainteresovani za razlike između dvije potpuno zasebne podgrupe u našem uzorku . Ako bi, kojim slučajem, htjeli ispitati da li postoji razlika u istoj grupi država, prije ili nakon nekog događaja (tretmana), onda bi koristili T-test uparenih uzoraka.
Kako definišemo nultu hipotezu kada koristimo T-test?
Ho: Ne postoje statistički značajne razlike u aritmetičkim sredinama između grupa. Ne postoji povezanost između nezavisne i zavisne varijable.
1.1. T-test nezavisnih uzoraka
1.1.1 Pitanje 1: Da li je tip režima povezan sa nivoom ekonomskog razvoja?
ttest1 <- t.test(gdp ~ dem_rezim, data = dem)
ttest1
Welch Two Sample t-test
data: gdp by dem_rezim
t = -3.0341, df = 137.3, p-value = 0.002886
alternative hypothesis: true difference in means between group No and group Yes is not equal to 0
95 percent confidence interval:
-12244.723 -2581.948
sample estimates:
mean in group No mean in group Yes
9156.049 16569.385
Ukoliko bi htjeli iskoristi drugi način, koji znači bukvalno razdvajanje dvije datotetka u dva zasebna poduzorka, onda bi to mogli uraditi na sljedeći način:
dem_d <- subset(dem, dem_rezim == "Yes") # kreiranje poduzorka demokratskih država
dem_nd <- subset(dem, dem_rezim == "No") # kreiranje poduzorka nedemokratskih država
ttest11 <- t.test(dem_d$gdp, dem_nd$gdp)
ttest11
Welch Two Sample t-test
data: dem_d$gdp and dem_nd$gdp
t = 3.0341, df = 137.3, p-value = 0.002886
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
2581.948 12244.723
sample estimates:
mean of x mean of y
16569.385 9156.049
Iako smo isti rezultat, preferiramo korišćenje prvog metoda zbog jednostavnosti koda. Ipak, druga varijanta je korisna ukoliko radimo sa grupama podataka koji ne dolaze iz istog izvora i nijesu dio iste baze podataka, kao i u situacijama kada želimo uporediti samo dvije katerije varijable koja ima više od dvije kategorije.
U rezultatima možemo viđeti vrijednost statistike t = -3.03 i nivo pouzdanosti p-value = 0.02. To su dvije najvažnije informacije u izvodu analize. Ako je p-vrijednost t-statistike ispod određenog praga koji smo postavili (obično 0,05 ili 5%), tada možemo odbaciti nultu hipotezu i prihvatiti alternativnu hipotezu da razlika u aritmetičkim sredinama između dvije grupe država nije jednaka 0 (odnosno da postoje značajne razlike). Takođe, možemo pogledati interval povjerenja i aritmetičku sredinu za dvije grupe. U ovom slučaju jasno je da ima značajnih razlika između demokratskih i nedemokratskih država.
Interpretacija: Sa pouzdanošću od 95% možemo reći da imamo dovoljno dokaza da kažemo da postoji statistički značajna razlika u nivou ekonomskog razvoja između demokratija i nedemokratija. Smjer odnosa je pozitivan, odnosno države koje su demokratske imaju značajno veći nivo BDP-a od država koje to nijesu. Snaga odnosa je jaka, s obzirom na to da je razlika između dvije grupe, u prosjeku nešto više od 7,000 dolara.
1.1.2 Pitanje 2: Da li je rodna ravnopravnost povezana sa ekonomskim razvojem?
S obzirom na to da varijable nivo rodne ravnopravnosti ima tri kategorije (“niska”, “umjerena” i “visoka”), kako bi primijenili t-test, moramo ili rekodirati varijablu u dihotomnu ili “izvući” dvije kategorije koje želimo da uporedimo. Ukoliko, recimo, želimo da uporedimo države niske sa državama visoke rodne ravnopravnosti, to možemo uraditi na sljedeći način:
dem_nr <- subset(dem, rodna_jed == "Niska")
dem_r <- subset(dem, rodna_jed == "Visoka")
ttest2 <- t.test(dem_r$gdp, dem_nr$gdp)
ttest2
Welch Two Sample t-test
data: dem_r$gdp and dem_nr$gdp
t = 10.474, df = 44.425, p-value = 0.0000000000001397
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
24032.41 35480.38
sample estimates:
mean of x mean of y
35507.308 5750.917
U ovom slučaju možemo viđeti da je p-vrijednost t-statistike značajno ispod 0,05. Aritmetička sredina BDP-a među državam sa niskim nivoom rodne ravnopravnosti je u prosjeku 5,750 dolara godišnje, dok je prosjek kod država koje imaju visko nivo rodne ravnopravnosti 35,500 dolara godišnje (po glavi stanovnika). Na osnovu ovoga možemo biti sigurni da je razlika u nivou ekonomskog razvoja između dvije grupe država dovoljno velika da nije mogla nastati kao rezultat slučajnosti.
Napomena: Kada se tumači p-vrijednosti i statistička značajnost, uvijek je važno imati na umu da statistička značajnos zavisi od veličine uzorka. Što je veća veličina uzorka, to je manja standardna greška. Stoga je uvijek važno obratiti pažnju na suštinsku značajnost, a ne samo statistički.
1.1.3 Pitanje 3: Da li su manje države demokratičnije od država sa većom populacijom?
Ukoliko želimo da testiramo odnos između veličine države (mjereno u veličini populacije) i nivoa demokratije to možemo uraditi koristeći T-test, ukoliko nezavisnu varijablu svedemo na dvije kategorije. Iz tog razloga, prvo ćemo rekodirati varijablu popul tako da jedna kategorija budu države sa brojem stanovnika manjim od medijane, a druga kategorija države sa brojem stanovnika većim od medijane.
Prvo ćemo utvditi vrijednost medijane i rekodirati varijablu shodno tome:
describe(dem$popul) vars n mean sd median trimmed mad min max range skew kurtosis
X1 1 166 41.48 144.93 10 16.72 11.86 0.3 1354.1 1353.8 7.74 63.51
se
X1 11.25
dem$popul_d <- recode(dem$popul, "0:10 = 0; 10.01:hi=1")
table(dem$popul_d)
0 1
84 82
ttest3 <- t.test(nivo_dem ~ popul_d, data = dem)
ttest3
Welch Two Sample t-test
data: nivo_dem by popul_d
t = 1.282, df = 139.57, p-value = 0.202
alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0
95 percent confidence interval:
-0.4307313 2.0193810
sample estimates:
mean in group 0 mean in group 1
6.328571 5.534247
Na osnovu testa možemo zaključiti da iako u prosjeku manje države imaju viši nivo demokratije (6.32) u odnosu na veće države (5.53), ova razlika nije statistička značajna (p=0.202).
Da li bi dobili isti rezultat ukoliko bi drugačije definisali kategorije “malih” i “velikih” država?
1.2. T-test uparenih uzoraka
Korišćenje T-testa uparenih uzoraka u R vrši se na način veoma sličan prethodnom primjeru. Potrebno je unijetu izmjene koje se odnose na to koje varijable koristimo za grupisanje, kao i dodatni argument o tome da li da R tretira uzorke kao nezavisne ili kao uparene. To je moguće uraditi koristeći argument paired = TRUE. Kada su u pitanju anketna istraživanja, ova vrsta analize se posebno često koristi u slučaju panel studija. Jedina razlika je u tome što je potrebno kao nezavisnu varijablu specifikovati koji poduzorak je prikupljen prije a koji nakon tretmana.
#primjer kako bi uradili test uparenih uzoraka kada bi imali podatke
#koji odgovaraju takvom metodu
ttest4 <- t.test(ZV ~ NV, data = baza, paired = TRUE)
ttest4Razlike između jednosmjernog i dvosmjernog test-a?
2. ANOVA
Često imamo posla s intervalnom zavisnom varijablom i kategoričkom nezavisnom varijablom sa više od dvije kategorije. U tom slučaju, želimo izvršiti analizu varijanse koja će nam reći postoji li razlika između aritmetičkih sredina svih grupa. Ovaj test reći će nam da li se bilo koja od grupa bitno razlikuje od drugih, ali ne i koja. To moramo interpretirati na drugi način, nezavisno od samog statističkog testa. Slijedi jednostavna jednosmjerna analiza varijanse - sa jednom zavisnom varijablom i jednom nezavisnom varijablom.
ANOVA se implementira u R-u sa funkcijom aov(). Moramo definisati formulu i reći funkciji koju će bazu podataka koristiti.
2.1. Pitanje 4: Da li je etnička raznolikost povezana sa ekonomskom nejednakošću?
Ovaj testo možemo sprovesti koristeći ANOVA i prikazali rezultate analize funkcijom summary():
anova1 <- aov(gini ~ etn_frak, data = dem)
summary(anova1) Df Sum Sq Mean Sq F value Pr(>F)
etn_frak 2 521 260.7 2.603 0.0783 .
Residuals 117 11720 100.2
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
47 observations deleted due to missingness
Najvažnija informacija koju ovđe treba potražiti je vrijednost F i sa njom povezana vrijednost p (Pr (> F)). Ako je drugo manje od našeg praga za statističku značajnost (0.05), možemo zaključiti da postoji statistički značajna razlika između aritmetičkih sredina grupa.
U našem slučaju vrijednost je 0.078, što nam ne dopušta da odbacimo nultu hipotezu da nema razlike u aritmetičkim sredinama među kategorijama.
Rezultate možemo i vizuelno prikazati. Postoji više načina za to, ovđe je najjednostavnije koristiti funkciju plotmeans() iz paketa gplots. Funkcija koristi isti skup argumenata koji bismo koristili za funkciju aov().
Isti kod za grafičko prikazivanje možemo koristiti iza T-test.
plotmeans(gini ~ etn_frak, data = dem)Grafik nam pokazuje aritmetičku sredinu za grupe s odgovarajućim intervalima povjerenja. Možemo vidjeti da je interval povjerenja za jednu grupu takav da se ne preklapa s intervalom pouzdanosti za druge grupe.Dakle, test pokazuje statistički značajnu razliku između grupa.
2.2. Pitanje 1: Da li je tip režima povezan sa nivoom ekonomskog razvoja?
Što ako ponovo analiziramo odnos tipa režima i ekonomskog razvoja, ali ovaj put koristeći varijablu sa više od dvije kategorije nezavisne varijable?
anova2 <- aov(gini ~ tip_rezima, data = dem)
summary(anova2) Df Sum Sq Mean Sq F value Pr(>F)
tip_rezima 3 1504 501.2 5.479 0.00147 **
Residuals 118 10794 91.5
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
45 observations deleted due to missingness
Shodno p-vrijednosti možemo zaključiti da postoji razlika između tipa režima i nivoa ekonomske nejednakosti. Međutim, kao što smo rekli ranije, ne možemo znati samo na osnovu testa odakle ta razlika dolazi. Zato ćemo se ponovo poslužiti grafikom.
plotmeans(gini ~ tip_rezima, data = dem)Napomena: prilikom tumačenja statističke i suštinske znalajnosti koristeći grafike, važno je obratiti pažnju na vrijednosti Y osi.
Na bazi grafika možemo zaključiti da ne postoje veće razlike između autoritarnih, hibridnih i poludemokratija. Međutim, jasno je da pune ili konsolidovane demokratije imaju značajno niži nivo ekonomske nejednakosti od drugih tipova režima i da je to kategorija koja je “odgovorna” razliku koju je test identifikovao.